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Fui3schalter fur einen rompnter 



Die Erfindung bezieht sich auf eine Eingabeeinrichtung gemafi dem Oberbegriff des 
5 Anspruch 1 . 

Eine solche mit einem FuB betatigbare Eingabeeinrichtung gemaB dem Oberbegriff des 
Anspruch 1 ist aus dem Dokument WO97/34407 bekannt und durch einen FuBschalter 
1 0 gebildet. Der bekannte FuBschalter weist AnschluBmittel auf, mit denen der FuBschalter 
zum Abgeben einer Steuerinformation an einen Game-Port eines Computers anschlieBbar 
ist. An den Computer ist weiters ein Eingangsverstarker, an den ein Mikrofon 
angeschossen ist, ein Ausgangsverstarker, an den ein Kopfhorer angeschlossen ist, eine 
Tastatur und ein Monitor anschlieBbar. Der Computer weist eine A/D-Wandlerstufe, eine 
15 D/A-Wandlerstufe und Audio-Speichermittel auf 

Mit dem Computer ist ein Anwendungsprogramm abarbeitbar, bei dem eine Diktier- 
Betriebsart aktivierbar ist, wobei der Computer eine Diktiereinrichtung bildet. Bei 
aktivierter Diktier-Betriebsart wird eine von einem Benutzer in das Mikrofon gesprochene 
Sprachinformation eines Diktats als analoges Audiosignal mit dem Eingangsverstarker 
20 verstarkt, mit der A/D-Wandlerstufe verarbeitet und als digitale Audioinformation in den 
Audio-Speichermitteln des Computers gespeichert. 

Bei dem Anwendungsprogramm ist weiters eine Audiowiedergabe-Betriebsart 
aktivierbar, bei der die in den Audio-Speichermittein gespeicherte digitale 
Audioinformation von der D/A-Wandlerstufe verarbeitet und als analoges Audiosignal mit 
25 dem Ausgangsverstarker verstarkt an den Kopfhorer abgegeben wird. Eiir/e Sekretar/in 
kann die mit dem Kopfhorer wiedergegebene Sprachinformation des Diktats abhOren und 
eine entsprechende Textinformation mit der Tastatur des Computers schreiben, worauf die 
Textinformation an dem Monitor angezeigt wird. 

Der FuBschalter weist mit einem FuB betatigbare Schalter auf, die FaBeingabemittel 
30 bilden. Der/Die Sekretar/in kann durch Betatigen der Schalter mit einem FuB eine 

Steuerinformation erzeugen, die uber den Game-Port an den Computer abgebbar ist und die 
die Audiowiedergabe-Betriebsart aktiviert oder deaktiviert, um die Hande fur das 
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Schreiben mit der Tastatur frei zu haben. 

Bei der bekannten mit einem FuB betatigbaren Eingabeeinrichtung fur einen Computer 
hat sich als Nachteil enviesen, dafi der Kopfhorer zum Wiedergeben einer in den Audio- 
Speichermitteln gespeicherten Audioinformation mit einem separaten Kabel an den 
5 Computer angeschlossen werden muB, was fur den Benutzer auf Grund der vielen 
AnschluBmoglichkeiten bei einem Computer nicht einfach ist. 

Der vorerwahnte Eingangsverstarker und Ausgangsverstarker sind bei einem Computer 
oft auf einer Sound-Karte vorgesehen, die meistens nur einen EingangsanschluB fur ein 
Mikrofon und nur einen AusgangsanschluB fiir einen Kopfhorer oder einen Lautsprecher 
10 aufweist. Hierbei hat sich als Nachteil enviesen, daB ein Computer nur dann als 

Diktiereinrichtung verwendbar ist, wenn sowohl eine Soimd-Karte mit freien Anschliissen 
als auch ein freier Game-Port AnschluB vorhanden sind. 

Weiters hat sich als Nachteil erwiesen, daB die Ubertragung einer Steuerinformation 
uber den Game-Port des Computers nicht sehr zuverlassig flinktioniert und manchmal eine 
15 nicht enviinschte Betriebsart des Anwendungsprogranuns aktiviert wird. 



Die Erfindung hat sich zur Aufgabe gestellt, eine mit einem FuB betatigbare 

Eingabeeinrichtung zu schaffen, bei der die Nachteile der bekannten Eingabeeinrichtung 
20 nicht auftreten. Diese Aufgabenstellung wird bei einer mit einem FuB betatigbaren 

Eingabeeinrichtung gemaB dem Oberbegriff des Anspruch 1 durch die MaBnahmen des 

kennzeichnenden Teiles des Anspmch 1 gelost, 

GemaB den MaBnahmen nach Anspruch 1 ist erreicht, daB ein Lautsprecher oder ein 

Kopfhorer, der AnschluBmittel zum Aufbau einer digitalen Datenbusverbindung aufweist, 
25 direkt an die Eingabeeinrichtxmg anschlieBbar ist. Mit den AnschluBmitteln des Kopfhorers 

Oder des Lautsprechers empfangene digitale Audiodaten sind von Audio- 

Verarbeitungsmitteln des Kopfhorers oder des Lautsprechers verarbeitbar und akustisch 

wiedergebbar. 

Durch das direkte AnschlieBen eines Kopfhorers oder eines Lautsprechers zum Abhoren 
30 eines Diktats an die Eingabeeinrichtimg ist sowohl der Vorteil einer einfacheren 

Installation des AnschluBkabels des Kopfhorers bzw. des Lautsprechers als auch der 
Vorteil erhalten, daB der AusgangsanschluB der Sound-Karte und des Game-Ports des 
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Computers fur andere Anwendungen frei sind. Weiters muB der Computer 
vorteilhafterweise keine Sound-Karte aufweisen, urn als Diktiereinrichtung die 
Audiowiedergabe-Betriebsart abzuarbeiten. 

Bei der Ubertragung der Audioinformation und der Steuerinformation uber die digitale 
5 Datenbusverbindung werden Fehlerkorrekturcodes mit Qbertragen, weshaJb 

vorteilhafterweise auch bei einer schlechten Kabelverbindung oder einer schlechten 
Steckverbindung keine Qualitatsverluste der Audioinformation oder der Steuerinformation 
bei der Ubertragung auftreten. 

GemaB den MaBnahmen des Anspruch 2 ist der Vorteil erhalten, dafi von den 
10 AnschluBmitteln der Eingabeeinrichtung unmittelbar das analoge Audiosignal der 
Sprachinformation eines in den Audio-Speichermitteln als digitale Audiodaten 
gespeicherten Diktats an einen herkommlichen analogen Kopfhorer oder analogen 
Lautsprecher abgebbar ist. 

Gemafi den Mafinahmen des Anspruch 3 ist der Vorteil erhalten, daB uber eine USB- 
1 5 Datenbusverbindung auch eine Versorgungsspannung und ein ausreichender 

Versorgungsstrom ubertragbar ist, der zur Versorgung der Audio- Verarbeitungsmittel der 
Eingabeeinrichtung geeignet ist. Weiters weisen bereits sehr viele Computer 
AnschluBmittel mit einen USB-Anschlu6 auf, weshalb die Eingabeeinrichtung an viele 
Computer anschliefibar ist. 
20 GemaB den Mafinahmen des Anspruch 4 ist der Vorteil erhalten, daB eine in den Audio- 
Speichermittehi gespeicherte Audioinformation als analoges Audiosignal unmittelbar an 
den in die Eingabeeinrichtung eingebauten Lautsprecher abgebbar ist und daher kein 
weiteres Anschlufikabel notig ist. 

GemaB den MaBnahmen des Anspruch 5 und des Anspruches 6 ist der Vorteil erhalten, 
25 daB keine Kabelverbindung zum Ubertragen der Steuerinformation und der 
Audioinformation notwendig ist. 



Die Erfindung wird im Folgenden anhand von drei Anwendungsbeispielen eines in den 
30 Figuren dargestellten Ausfiihrungsbeispiels beschrieben, auf das die Erfmdung aber nicht 
beschrankt ist. 

Die Figur 1 zeigt eine Spracherkennungseinrichtung in Form eines Blockschaltbilds, an 
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die eine in einer Hand haltbare Eingabeeinrichtung und eine mit einem FuB betatigbare 
Eingabeeinrichtung angeschlossen sind und die Textvergleichsmittel, zum Vergleichen 
einer erkannten Textinformation mit einer korrigierten Textinformation, und die 
Transferal ittel, zum Importieren und Exportieren einer Sprachkoeffizienten-Information, 
5 aufweist. 

Die Figur 2 zeigt die in der Hand haltbare Eingabeeinrichtung gemaB Figur 1 in Form 
eines Blockschaltbilds, die Audio-Verarbeitungsmittel zum Verarbeiten eines analogen 
Audiosignals und zum Abgeben digitaler Audiodaten aufweist. 

Die Figur 3 zeigt die mit einem FuB betatigbare Eingabeeinrichtung gemaB Figur 1 in 
1 0 Form eines Blockschaltbilds, an die ein Kopfhorer anschlieBbar ist und die einen 
eingebauten Lautsprecher aufweist. 

Die Figur 4 zeigt eine von den Textvergleichsmitteln der Spracherkennungseinrichtung 
erstellte Anpassungstabelle, in der eine erkannte Textinformation und eine korrigierte 
Textinformation eingetragen sind. 

15 



Die Figur 1 zeigt einen Computer 1, mit dem ein Spracherkennungsprogramm gemaB 
einem Spracherkennungsverfahren abgearbeitet wird, wobei der Computer 1 eine 
Diktiereinrichtung mit nachgeschalteter Spracherkennungseinrichtimg bildet. 

20 An den Computer 1 ist ein Diktiermikrofon 2, das eine in einer Hand haltbare 
Eingabeeinrichtung bildet, ein FuBschalter 3, der eine mit einem FuB betatigbare 
Eingabeeinrichtung bildet, ein Monitor 4 und eine Tastatur 5 angeschlossen. In einer Figur 
2 ist das Diktiermikrofon 2 in Form eines Blockschaltbilds detailliert dargestellt. 

Das Diktiermikrofon 2 weist ein Mikrofon 6 auf, das Audio-Empfangsmittel bildet und 

25 zum Empfangen einer von einem Benutzer in das Mikrofon 6 gesprochenen 

Sprachinformation und zum Abgeben eines ersten analogen Audiosignals ASl ausgebildet 
ist. Das Diktiermikrofon 2 weist weiters Audio-Verarbeitungsmittel 7 auf, die zum 
Verarbeiten des ersten analogen Audiosignals ASl und zum Abgeben digitaler Audiodaten 
als Audioinformation AI ausgebildet sind. 

30 Die Audio-Verarbeitungsmittel 7 weisen eine erste Verstarkerstufe 8, eine A/D- 

Wandlerstufe 9, eine zweite Verstarkerstufe 10 und eine D/A-Wandlerstufe 1 1 auf. Das 
erste analoge Audiosignal ASl ist der ersten Verstarkerstufe 8 und das verstarkte erste 



PHO 99.531 EP-P 



-5 



15 



analoge Audiosignal ist der A/D-Wandlerstufe 9 zufiihrbar. Die A>T>-Wandlerstufe 9 ist 
zum Abtasten des verstarkten analogen Audiosignals mit einer Abtastfrequenz von 16kHz 
und zum Abgeben von Abtastwerten in digitalen Audiodaten ausgebildet, die Datenblocke 
mit 16 Bit aufweisen und als Audioinformation AI an USB-Anschlu6mittel 12 abgebbar 
5 sind. 

Hierdurch ist der Vorteil erhalten, daB das erste analoge Audiosignal AS 1 gleich in dem 
Diktiermikrofon digitalisiert wird daB die Verstarkerstufe 8 bereits bei der Herstellung des 
Diktiennikrofons 2 an die maximale Ausgangsspannung des Mikrofons 6 angepaBt werden 
kann. Es geht somit keine Sprachinformation durch ein Ubersteuem der Verstarkerstufe 8 
1 0 verloren, weshalb die digitale Audiodaten enthaltende Audioinformation AI eine gute 
Qualitat aufweist. 

Von den USB-AnschluBmitteIn 12 ist eine digitale Audiodaten enthaltende 
Audioinformation AI an die D/A-Wandlerstufe 1 1 der Audio- Verarbeitungsmittel 7 
abgebbar. Von der D/A-Wandlerstufe 1 1 ist ein den digitalen Audiodaten entsprechendes 
analoges Audiosignal an die zweite Verstarkerstufe 10 abgebbar. Ein von der zweiten 
Verstarkerstufe 10 abgegebenes zweites analoges Audiosignal AS2 ist an einen 
Lautsprecher 13 zur akustischen Wiedergabe abgebbar. 

Das Diktiermikrofon 2 weist weiters Eingabemittel 14 zum manuellen Eingeben einer 
Steuerinformation SI auf, die eine Tastatur 15, einen Trackball 16 und Eingabe- 
Verarbeitungsmittel 17 ehthalten. Die Tastatur 15 weist unter anderem eine Record- 
Eingabetaste 18. eine Stop-Eingabetaste 19, eine Vorlauf-Eingabetaste 20 und eine 
Riicklauf-Eingabetaste 21 auf. Von der Tastamr 15 ist eine Tasteninformation TSI an die 
Eingabe- Verarbeitungsmittel 17 abgebbar. 

Der Trackball 16 ist durch eine in einer Offhung des Diktiermikrofons 2 eingelegte 
Kugel gebildet, die von einem Benutzer gedreht werden kann, um beispielsweise einen mit 
dem Monitor 4 dargestellten Cursor zu positionieren. Von dem Trackball 1 6 ist eine 
Trackballinformation TBI an die Eingabe- Verarbeitungsmittel 17 abgebbar. Die Eingabe- 
Verarbeitungsmittel 17 sind zum Verarbeiten der an sie abgegebenen Tasteninformation 
TSI und Trackballinformation TBI und zum Abgeben einer entsprechenden 

30 Steuerinformation SI an die USB-Anschlufimittel 12 ausgebildet. 

Von den USB-AnschluCmitteln 12 ist eine Versorgungsspannung U sowohl an die 
Audio-Verarbeitungsmittel 7 als auch an die Eingabemittel 14 zur Versorgung der in den 
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Audio- Verarbeitungsmitteln 7 und den Eingabemitteln 14 enthaltenen Stufen abgebbar. 
Hierdurch ist der Vorteil erhalten, daB das Diktiermikrofon 2 sowohl Infonnationen als 
auch die Versorgungsspannung U der Stufen des Diktiermikrofons 2 tiber nur eine 
Kabelverbindung erhalt. 
5 Die USB-AnschluBmittel 12 sind uber einen ersten Anschlufi 22 des Diktiermikrofons 2 
mit USB-AnschluBmitteki 23 des Computers 1 verbunden. Die USB-AnschluBmittel 12 
des Diktiermikrofons 2 sind zum Aufbau einer digitalen Datenbusverbindung und hierbei 
vorteilhafterweise zum Aufbau einer USB-Datenbusverbindung (Universal Serial Bus: 
Specification Version 1.0 on January 15 and Version 2.0) mit den USB-AnschluBmitteln 

10 23 des Computers 1 ausgebildet. 

Bei einer USB-Datenbusverbindung werden den an das USB-AnschluBmittel 12 oder 23 
abgegebenen Audiodaten der Audioinformation AI oder Steuerdaten der Steuerinformation 
SI Fehlerkorrekturcodes angehangt und diese gemeinsam als Ubertragungsdaten UD an das 
USB-AnschluBmittel 23 oder 12 ubertragen. Das USB-AnschluBmittel 12 oder 23, von 

1 5 dem die Ubertragungsdaten UD empfangen wurden, ist zum Auswerten der 

Fehlerkorrekturcodes und zum Korrigieren gegebenenfalls bei der Ubertragung 
aufgetretener Fehler in den Audiodaten oder den Steuerdaten ausgebildet. Bei einer USB- 
Datenbusverbindung werden Steuerdaten einer Steuerinformation SI mit einer 
Datenubertragungsrate von 1,5 MBps und Audiodaten einer Audioinformation AI mit einer 

20 Datenubertragungsrate von 1 2 MBps ubertragen. 

In einer Figur 3 ist der in der Figur 1 dargestellte Fufischalter 3 in Form eines 
Blockschaltbildes detailliert dargestellt. Der Fufischalter 3 weist FuBeingabemittel 24 zum 
manuellen Eingeben einer Steuerinformation SI auf. Die FuBeingabemittel 24 enthalten 
einen Audiowiedergabe-Schalter 25, einen Stop-Schalter 26 und Eingabe- 

25 Verarbeitungsmittel 27. Eine von dem Audiowiedergabe-Schalter 25 oder dem Stop- 
Schalter 26 abgegebene Schaltinformation SCI ist an die Eingabe- Verarbeitungsmittel 27 
abgebbar. Die Eingabe- Verarbeitungsmittel 27 sind zum Verarbeiten der an sie 
abgegebenen Schaltinformation SCI und zum Abgeben einer entsprechenden 
Steuerinformation SI an USB-AnschluBmittel 28 des Fufischalters 3 ausgebildet, 

30 Der Fufischalter 3 weist weiters Audio- Verarbeitungsmittel 29 auf, die eine D/A- 

Wandlerstufe 30 und eine dritte Verstarkerstufe 31 enthalten. Eine Audiodaten enthaltene 
Audioinformation AI ist von den USB-AnschluBmitteln 28 an die D/A-Wandlerstufe 30 
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abgebbar, welche ein den Audiodaten entsprechendes analoges Audiosignal an die dritte 
Verstarkerstufe 3 1 abgibt. Ein von der dritten Verstarkerstufe 3 1 abgegebenes drittes 
analoges Audiosignal AS3 ist sowohl an einen in dem Fufischalter 3 vorgesehenen 
Lautsprecher 32 als auch an einen zweiten AnschluB 33 abgebbar. An den zweiten 
5 AnschluB 33 ist ein Kopfhorer 34 angeschlossen. Mit dem Lautsprecher 32 and dem 

Kopfhorer 34 ist eine akustische Wiedergabe einer Sprachinformation ermoglicht, worauf 
nachfolgend noch naher eingegangen ist. 

Durch das Vorsehen der Audio-Verarbeitungsmittel 29 in dem Fufischalter 3 ist der 
Vorteil erhalten, daB der Kopfhorer 34 oder ein Lautsprecher direkt an den Fufischalter 3 
1 0 angeschlossen werden kann. Hierdurch muB der Computer 1 , der auch eine 

Diktiereinrichtung bildet, keine Sound-Karte mit Audio- Verarbeitungsmitteln aufweisen. 

Die USB-AnschluBmittel 28 des FuBschalters 3 entsprechen den USB-AnschluBmitteln 
12 und 23. Von den USB-AnschluBmitteln 28 ist eine Versorgungsspannung U sowohl an 
die Eingabe-Verarbeitungsmittel 24 als auch an die Audio-Verarbeitungsmittel 29 zur^ 
1 5 Versorgung der in den Eingabe-Verarbeitungsmittehi 24 und den Audio- 

Verarbeitungsmittehi 29 enthaltenen Stufen abgebbar. Hierdurch ist der Vorteil erhalten, 
daB der Fufischalter 3 sowohl Informationen als auch die Versorgungsspannung U liber nur 
eine Kabelverbindung erhalt. 

Die USB-AnschluBmittel 28 des FuBschalters 3 sind uber einen dritten AnschluB 35 an 
20 die USB-AnschluBmitteIn 23 des Computers 1 angeschlossen. Der Computer 1 weist 
Empfangsmittel 36 auf, die die USB-AnschluBmittel 23 und Audio-Speichermittel 37 
enthalten und die zum Empfangen einer von einem Sprecher gesprochenen 
Sprachinformation ausgebildet sind. Hierbei ist eine von einem Sprecher in das Mikrofon 6 
des Diktiermikrofons 2 gesprochene Sprachinformation als durch digitale Audiodaten 
25 gebildete Audioinformation AI von den USB-AnschluBmitteln 12 an die USB- 
AnschluBmittel 23 ubertragbar und von den USB-Anschlufimitteln 23 an die Audio- 
Speichermittel 37 zur Speicherung der Audioinformation AI abgebbar. Eine von den USB- 
AnschluBmitteln 12 des Diktiermikrofons 2 oder von den USB-Anschlufimittehi 28 des 
FuBschalters 3 an die USB-AnschluBmittel 23 des Computers 1 abgegebene 

30 Steuerinformation SI ist von den USB-AnschluBmitteln 23 empfangbar und an weitere 

Mittel des Computers 1 abgebbar, worauf nachfolgend noch naher eingegangen ist. 
Die Spracherkennungseinrichtung, die durch den Computer 1 gebildet ist, weist 
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Sprachkoeffizienten-Speichermittel 38 auf, die zum Speichem einer Sprachkoeffizienten- 
Infoimation SKI ausgebildet sind. Die Sprachkoeffizienten-Information SKI enthalt cine 
Sprachmodell-Information SMI, eine Wortschatz-Information WI und eine 
Phonemreferenz-Information PRI. 
5 Die Wortschatz-Information WI ist in Wortschatz-Speichermitteln 39 gespeichert und 
enthalt samtliche von der Spracherkennungseinrichtuhg in einer Sprachinformation 
erkennbaren Worte sowie einen Haufigkeitszahler je Wort, der die 
Auftrittswahrscheinlichkeit des Worts in einer Sprachinformation angibt. Die 
Sprachmodell-Information SMI ist in Sprachmodell-Speichermitteln 40 gespeichert und 

1 0 enthalt Wortfolgen sowie einen Haufigkeitszahler je Wortfolge, der die 

Auftrittswahrscheinlichkeiten dieser Wortfolge in einer Sprachinformation angibt. Die 
Phonemreferenz-Information PRI ist in Phonemreferenz-Speichermitteln 41 gespeichert 
und ermoglicht ein Anpassen der Spracherkennungseinrichtung an Eigenarten der 
Aussprache eines Sprechers. 

15 Die Spracherkennungseinrichtung weist weiters Spracherkennungsmittel 42 auf Von 
den USB-AnschluCmitteln 23 ist eine Steuerinformation SI zur Aktivierung einer 
Spracherkennungs-Betriebsart zur Abarbeitung eines Spracherkermungsverfahrens an die 
Spracherkennungsmittel 42 abgebbar. Die Spracherkennungsmittel 42 sind bei aktivierter 
Spracherkennungs-Betriebsart zum Auslesen einer in den Audio-Speichermitteln 37 

20 gespeicherten Audioinformation AI und zum Auslesen der in den Sprachkoeffizienten- 
Speichermitteln 38 gespeicherten Sprachkoeffizienten-Information SKI ausgebildet. 

Die Spracherkennungsmittel 42 sind bei der Abarbeitung des 
Spracherkermungsverfahrens zum Ausv/erten der Audioinformation AI und der 
Sprachkoeffizienten-Information SKI ausgebildet. Hierbei ermitteln die 

25 Spracherkennungsmittel 42 zu jedem Teil der Audioinformation AI mehrere mogliche 

Wortfolgen, die gegebenenfalls dem jeweiligen Teil der Audioinformation AI entsprechen, 
und geben diese moglichen Wortfolgen fiir alle Teile der Audioinformation AI als 
mogliche Textinformation PTI ab. Die mogliche Textinformation PTI enthalt also 
beispielsweise 20 mogliche Wortfolgen fur die Audioinformation AI. Weiters ermitteln die 

30 Spracherkennungsmittel 42 - bei der Abarbeitung des Spracherkermungsverfahrens - die 

jeweils wahrscheinlichste Wortfolge fur jeden Teil der Audioinformation AI und geben 
diese ermittelten wahrscheinlichsten Wortfolgen der gesamten Audioinformation AI als 
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erkannte Textinformation RTI ab. 

Die Spracherkennungseinrichtung weist Text-Speichermittel 43 zum Speichem von 
Textinformationen auf. Die Text-Speichermittel 43 enthalten Moglicher-Text- 
Speichermittel 44, Erkannter-Text-Speichermittel 45, Korrigierter-Text-Speichermittel 46 
5 sowie Trainings-Text-Speichermittel 47. Eine von den Spracherkennungsmitteln 42 bei der 
Abarbeitung des Spracherkennungsverfahrens abgegebene mSgliche Textinformation PTI 
ist in den Moglicher-Text-Speichermittel 44 und eine abgegebene erkannte 
Textinformation RTI ist in den Erkannter-Text-Speichemiittel 45 speicherbar. 

Der Computer 1 ist weiters zum Abarbeiten eines Textverarbeitungsprogramms - wie 
1 0 beispielsweise „Word for Windows95" - ausgebildet und bildet hierbei 

Textverarbeitungsmittel 48. Eine von den Spracherkennungsmitteln 42 bei der Abarbeitung 
des Spracherkennungsverfahrens abgegebene erkannte Textinformation RTI ist an die 
Textverarbeitungsmittel 48 abgebbar. Die Textverarbeitungsmittel 48 sind hierauf zum 
Abgeben einer die erkannte Textinfomiation RTI enthaltenden Bildinformation PI an den 
1 5 Monitor 4 ausgebildet. 

Mit den Eingabemitteln 14 des Diktiermikrofons 2 ist eine Steuerinformation SI 
eingebbar, die an die Spracherkennungsmittel 42 und die Textverarbeittingsmittel 48 
abgebbar ist und die eine Korrektur-Betriebsart der SpracherkennungseinrichUing aktiviert. 
Die Textverarbeittingsmittel 48, der Monitor 4 und die Tastattir 5 bilden hierbei 
20 Korrekturmittel 49. Bei aktivierter Korrektur-Betriebsart kann ein Benutzer mit der 
Tastattir 5 die erkannte Textinformation RTI korrigieren und eine korrigierte 
Textinfomiation CTI in den Korrigierter-Text-Speichermittehi 46 speichem, worauf 
nachfolgend noch nSher eingegangen ist. 

In den Trainings-Text-Speichermitteln 47 ist eine Trainingstextinformation TTI 
gespeichert, die typische Worte und Redewendungen bzw. Wortfolgen eines bestimmten 
Bereichs (Geschaftsbriefe; Fachgebiet: Radiologic; Fachgebiet: Recht...) enthalt. Mit den 
Eingabemitteln 14 des Diktiermikrofons 2 ist eine Steuerinformation SI eingebbar, die an 
die Spracherkennungsmittel 42 und die Textverarbeittingsmittel 48 abgebbar ist und die 
eine Initialtraining-Betriebsart der Spracherkennungseinrichtting aktiviert. 

30 Bei aktivierter Initialtt-aining-Betriebsart sind die Textverarbeitungmittel 47 zum 

Auslesen der Trainingstextinformation TTI aus den Trainingstext-Speichermitteln 47 und 
zum Abgeben einer entsprechenden Bildinformation PI an den Monitor 4 ausgebildet. Von 
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einem Benutzer kann hierauf der mit dem Monitor 4 angezeigte Trainingstext in das 
Mikrofon 6 gesprochen werden, um die Spracherkennungseinrichtung an die Art der 
Aussprache des Benutzers anzupassen. 

Die Spracherkennungseinrichtung weist nunmehr Anpassungsmittel 50 auf, um die in 
5 den Sprachkoeffizienten-Speichermitteln 38 gespeicherte Sprachkoeffizienten-Information 
SKI sowohl an die Art der Aussprache des Benutzers als auch an von dem Benutzer 
ublicherweise verwendete Worte und Wortfolgen anzupassen. Die Text-Speichermittel 43, 
die Korrekturmittel 49, und die Anpassungsmittel 50 bilden hierbei Trainingsmittel 51. Ein 
seiches Anpassen der Sprachkoeffizienten-Information SKI erfolgt bei aktivierter 

1 0 Initialtraining-Betriebsart, bei der die von dem Benutzer vorgelesene 
Trainingstextinformaion TTI bekannt ist. 

Ein solches Anpassen erfolgt aber auch bei einer Anpassungs-Betriebsart, bei der eine 
einer Sprachinformation entsprechende Textinformation als erkannte Textinformation RTI 
erkannt und von dem Benutzer in eine korrigierte Textinformation CTI korrigiert wurde. 

1 5 Hierfur weisen die Trainingsmittel 5 1 Textvergleichsmittel 52 auf, die zum Vergleichen 
der erkannten Textinformation RTI mit der korrigierten Textinformation CTI und zum 
Ermitteln zumindest eines Ubereinstimmungswerts CI ausgebildet sind. In den 
Textvergleichsmitteln 52 wird bei aktivierter Anpassungs-Betriebsart eine in einer Figur 4 
dargestellte Anpassungstabelle 53 erstellt, worauf nachfolgend noch naher eingegangen ist. 

20 Von den Anpassungsmitteln 50 ist als Ergebnis der Anpassung eine 

Anpassungsinformation NI an die Sprachkoeffizienten-Speichermittel 38 abgebbar, mit der 
die gespeicherte Sprachkoeffizienten-Information SKI angepaBt wird. Von den 
Anpassungsmitteln 50 der Trainingsmittel 5 1 ist weiters ein Trainingsindikator TI 
abgebbar, der das Ausmafi der Anpassung der in den Sprachkoeffizienten-Speichermitteln 

25 38 gespeicherten Sprachkoeffizienten-Information SKI angibt. Der Trainingsindikator TI 
enthalt hierbei eine Information, wie oft und mit welcher Anzahl von Worten die in den 
Sprachkoeffizienten-Speichermitteln 38 gespeicherte Sprachkoeffizienten-Information SKI 
bereits an einen Benutzer angepaCt wiu-de. Je ofter die Sprachkoeffizienten-Information 
SKI an einen Benutzer angepaBt wurde, desto besser ist die Erkennungsrate der 

30 Spracherkennungseinrichtung fiir diesen Benutzer. 

Die Spracherkennungseinrichtimg weist nunmehr Transfermittel 54 auf, die ein 
Importieren einer Sprachkoeffizienten-Information SKI und ein Speichem der importierten 
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Sprachkoeffizienten-Information SKI in den Sprachkoeffizienten-Speichermitteln 38 
und/oder ein Exportieren der in den Sprachkoeffizienten-Speichermitteln 38 gespeicherten 
Sprachkoeffizienten-Information SKI ermoglichen. Hierfur ist von dem Benutzer eine 
Transferinfoimation TRI mit der Tastatur 5 eingebbar und an die Transfermittel 54 
5 abgebbar, worauf nachfolgend naher eingegangen ist. 

Anhand eines ersten Anwendungsbeispiels ist numnehr die Funktion des 
Diktiermikrofons 2, des FuBschalters 3 und der durch den Computer 1 gebildeten 
Diktiereinrichtung und Spracherkennungseinrichtung naher erlautert. GemaB dem ersten 
Anwendungsbeispiel ist angenommen, dal3 der Benutzer des Computers 1 einen Brief 
1 0 diktieren mochte, urn bei seinem Bekannten .John" drei Computer des Typs ..Quality" zu 
bestellen. Hierftlr betatigt der Benutzer die Record-Eingabetaste 18 des Diktiennikrofons 2 
und diktiert ..Dear John I herewith order three computer Quahty for my office Harry". Eine 
dieser Sprachinformation entsprechend Audioinformation AI wird hierauf von dem 
Diktiermikrofon 2 als Ubertragungsdaten UD an die USB-Anschlul3mitteI 23 ubertragen 
1 5 und schlieSlich in den Audio-Speichermitteln 37 gespeichert. Bei diesem Vorgang bilden 
das Diktiermikrofon 2 und der Computer 1 eine Diktiereinrichtung. 

Durch das Betatigen der Record-Eingabetaste 18 des Diktiermikrofons 2 wird eine die 
Spracherkennungs-Betriebsart der Spracherkennungsmittel 42 aktivierende 
Steuerinformation SI von dem Diktiermikrofon 2 als Ubertragungsdaten UD uber die USB- 
20 AnschluSmittel 23 an die Spracherkennungsmittel 42 abgegeben. Bei in den 

Spracherkennungsmitteln 42 aktivierter Spracherkennungs-Betriebsart wird die in den 
Audio-Speichermitteln 37 gespeicherte Audioinformation AI ausgelesen und gemeinsam 
mit der aus den Sprachkoeffizienten-Speichermitteln 38 ausgelesenen Sprachkoeffizienten- 
Inforraation SKI ausgewertet. Hierbei ermitteln die Spracherkennungsmittel 42 mehrere 
25 mogliche Wortfolgen als mogliche Textinformation PTI und speichem diese in den 

Moglicher-Text-Speichermitteln 44. Eine mogliche Textinformation PTI konnte hierbei ftir 
den ersten Teil der Audioinformation AI beispielsweise die Wortfolgen , Jiear John why". 
,X>ear John I" und ,3ear John hi" enthalten. 

Die Spracherkennungsmittel 42 ermitteln die Textinformation „Dear John I herewith 
30 organ three computer Quality for my office Mary" als wahrscheinlichste Tf.vtin fnrmation 
und geben diese als erkannte Textinformation RTI an die Erkannter-Text-Speichermittel 45 
ab. Hierbei wurde das gesprochene Wort ..order" als das Wort ..organ" und das 
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gesprochene Wort j^arry*' als das Wort , Jvlary" falsch erkannt. 

Die von den Spracherkennungsmittel 42 erkannte und in den Erkannter-Text- 
Speichermitteln 45 gespeicherte erkannte Textinformation RTI wird hierauf mit den 
Textverarbeitungsmitteln 48 ausgelesen und mit dem Monitor 4 dargestellt. Der Benutzer 
5 erkennt, dafi die beiden gesprochenen Worte „order" und , Jiarry" falsch erkannt woirden 
und mochte die erkannte Textinformation RTI korrigieren, weshalb der Benutzer mit den 
Eingabemitteln 14 des Diktiermikrofons 2 die Korrektur-Betriesart der 
Spracherkennungseinrichtung aktiviert. 

Bei aktivierter Korrektur-Betriebsart kann der Benutzer durch Betatigen des 

10 Audiowiedergabe-Schalters 25 des FuBschalters 3 die in den Audio-Speichermitteln 37 
gespeicherte Audioinformation AI mit dem Kopfhorer 34 oder dem Lautsprecher 32 
akustisch wiedergeben, wobei synchron zu der wiedergegebenen Audioinformation AI die 
zu der Audioinformation AI erkannte Textinformation RTI mit dem Monitor 4 
gekennzeichnet wird. Eih solches synchrones Editieren bzw. Korrigieren ist seit langem 

1 5 bekaimt, 

Bei einer ersten Art der Korrektur der erkannten Textinformation RTI durch den 
Benutzer korrigiert der Benutzer nur die falsch erkannten Worte „organ" und „Mary" in die 
beiden eigenthch gesprochenen Worte „order** und ,^arry" und es wird eine korrigierte 
Textinformation CTI in den Textverarbeitungsmitteln 48 erstellt und in den Korrigierter- 

20 Text-Speichermitteln 46 gespeichert. Diese nach der ersten Art der Korrektur in den 

Korrigierter-Text-Speichermitteln 46 gespeicherte korrigierte Textinformation CTI ware 
zur Anpassung der Sprachkoeffizienten-Information SKI besonders gut geeignet. Die bei 
einem weiteren Diktat des Benutzers gesprochenen Worte „order" und „Harry" wtirden bei 
einem darauffolgenden Spracherkennungsvorgang mit der zuvor angepaJJten 

25 Sprachkoeffizienten-Information SKI richtig erkannt werden. 

Wie die Praxis zeigt, werden von Benutzem bei aktivierter Korrektur-Betriebsart auch 
andere Korrekturen gemaB einer zweiten Art der Korrektur durchgefuhrt. GemaB dem 
ersten Anwendungsbeispiel ist angenommen, daC sich der Benutzer nunmehr erinnert, dafi 
er ebenfalls drei Computer des Typs ^Standard" bestellen mochte, weshalb der Benutzer 

30 die Wortfolge „and three computer Standard" mit der Tastatur 5 in die bereits korrigierte 

Textinformation CTI einfugt. Welters kopiert der Benutzer einen Text A vor den Anfang 
der bereits korrigierten Textinformation CTI, der die Adresse des Briefes an seinen 
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Bekannten , John" enthalt. Letztlich kopiert der Benutzer einen Text B nach der bereits 
korrigierten Textinformation CTI in die korrigierte Textinformation CTI hinein, die eine 
bei solchen Bestellungen ubliche Fufinote uber vereinbarte Prozentnachlasse beinhaltet. 
Hierbei wurden von dem Benutzer Textteilinformationen in die erkannte 
5 Textinformation RTI eingefligt, die mit der von dem Benutzer bei dem Diktat 
gesprochenen Sprachinformation keinen Zusammenhang haben. Solche 
Textteilinformationen durfen nicht zur Anpassung der Phonemreferenz-Information PRI 
ausgewertet werden, da keine entsprechende Audicinformation AI in den Audio- 
Speichermitteln 37 gespeichert ist. Weiters ist es nicht gut, die Wortschatz-Information WI 

1 0 Oder die Sprachmodell-Information SMI mit solchen Textteilinformationen anzupassen, da 
der Text A und der Text B oft in korrigierten Textinformationen CTI des Benutzers 
enthalten sind, in Diktaten des Benutzers aber praktisch nie gesprochen werden. 

Wenn die Wortschatz-Information WI und die Sprachmodell-Information SMI mit 
Textteilinformationen trainiert werden wurden, die keinen Zusammenhang mit der 

1 5 Sprachinformation aufweisen, daim hatte beispielsweise die Wortfolge des in dem Text A 
enthaltenen StraBennamen „Hellroad" der Adresse des Bekaimten John eine hohe 
Auftrittswahrscheinlichkeit, da der Benutzer oft Briefe an John schreibt und die Adresse 
immer in die korrigierte Textinformation CTI hinein kopiert. Nunmehr wiirde aber eine in 
einem Diktat gesprochene Wortfolge ,»Hello Rod" relativ leicht falsch erkannt werden, da 

20 die Wortfolge „Hello Rod" in den Sprachmodell-Speichermitteln 40 eine verglichen mit 
der Wortfolge ,^ellroad" relativ niedrigere Auftrittswahrscheinlichkeit aufweisen wiirde, 
obwohl die Wortfolge „Hello Rod" in Diktaten des Benutzers relativ haufig vorkommt. 

Nachdem der Benutzer alle von Dim gewoinschten Korrekturen durchgefiihrt hat und die 
korrigierte Textinformation CTI in den Korrigierte-Text-Speichermitteln 46 gespeichert 

25 wurde, betatigt der Benutzer eine Taste der Tastatur 15 des Diktiermikrofons 2, um die 
Anpassungs-Betriebsart der Spracherkennungseinrichtung zu aktivieren und die 
Sprachkoeffizienten-Information SKI der Spracherkennungseinrichtung anzupassen. Eine 
entsprechende Steuerinformation SI wird hierauf von dem Diktiermikrofon 2 uber die 
USB-Anschlufimittel 23 an die Spracherkennungsmittel 42 abgegeben. 
30 Bei in der Spracherkennungseinrichtung aktivierter Anpassungs-B e tri e bsart sind di e 



Anpassungsmittel 50 zum Auslesen der in den Audio-Speichermitteln 37 gespeicherten 
Audioinformation AI, sowie der in den Text-Speichermitteln 43 gespeicherten moglichen 
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Textinformation PTI, erkannten Textinformation RTI und korrigierten Textinformation 
CTI ausgebildet. Weiters sind die Textvergleichsmittel 52 bei aktivierter Anpassungs- 
Betriebsart zum Erstellen der in der Figur 4 dargestellten Anpassnngstabelle 53 
ausgebildet, um jene Textteilinformationen der korrigierten Textinformation CTI zu 
5 ermitteln, die zur Anpassung der Sprachkoeffizienten- Information SKI geeignet sind. 
Hierflir wird vorerst die erkannte Textinformation RTI und die korrigierte 
Textinformation CTI in die Anpassxmgstabelle 53 eingetragen, wobei falsch erkannte 
Worte sowie korrigierte und eingefiigte Worte und Textteile mit der Schriftart „fett" 
dargestellt sind. Die Textvergleichsmittel 52 sind nunmehr zum Vergleichen der erkannten 

10 Textinformation RTI und der korrigierten Textinformation CTI und zum Kennzeichnen 
tibereinstimmender Worte durch graue Felder an der entsprechenden Stelle der 
Anpassungstabelle 53 ausgebildet. Hierbei wird die Textteilinformation mit den Worten 
„three computer" der erkannten Textinformation RTI zwei Mai in der korrigierten 
Textinformation CTI gefunden. 

15 Weiters sind die Textvergleichsmittel 52 beim Vergleichen der erkannten 

Textinformation RTI und der korrigierten Textinformation CTI zum Ermitteln eines 
Ubereinstimmungswerts CI fur jede Textteilinformation ausgebildet. Hierbei ermitteln die 
Textvergleichsmittel 52 wie viele iibereinstimmende durch ein graues Feld 
gekennzeichnete Worte eine Textteilinformation aufweist. Weiters ermitteln die 

20 Textvergleichsmittel 52 Strafpunkte fur jede Textteilinformation, wobei fur jede 

Einfugung, Loschung oder Ersetzung eines Wortes in der korrigierten Textinformation CTI 
ein Strafpunkt vergeben wird. Aus der Anzahl der ubereinstimmenden Worte und der 
Strafpunkte einer Textteilinformation wird der Ubereinstimmungswert CI der 
Textteilinformation ermittelt. 

25 In den Textvergleichsmitteln 52 ist ein Mindestwert MW fur den 

Ubereinstimmungswert CI festgelegt, der unterschritten wird, wenn fiir eine 
Textteilinformation mehr als drei Strafpunkte fur Korrekturen benachbarter Worte der 
korrigierten Textinformation CTI vergeben werden. Fiir die Anpassung der 
Sprachkoeffizienten-Information SKI werden nur Textteilinformationen verwendet, deren 

30 — Ubereinstimmungswert CI den Minde s twert MW iiber s chreitet. 

Die Textvergleichsmittel 52 werten nunmehr die Anpassungstabelle 53 aus und 
erkennen, daB samtliche Worte des Text A und des Text B in der korrigierten 
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Textinformation CTI eingefugt wurden, weshalb die Textvergleichsmittel 52 ftr den Text 
A und den Text B eine mit der Anzahl der Worte des Text A und das Text B 
ubereinstimmende Anzahl an Stra^unkten vergeben. Die Textvergleichsmittel 52 geben 
daher einen Ubereinstimmungswert CI ftir den Text A und den Text B an die 
5 Anpassungsmittel 50 ab, der kleiner als der Mindestwert MW ist. Hierdurch ist der Vorteil 
erhalten, daB eine Textteilinformation der korrigierten Textinformation CTI, die uberhaupt 
keinen Zusammenhang mit der Sprachinformation aufweist, fur die Anpassung der 
Sprachkoeffizienten-Information SKI nicht verwendet wird. 

GemaB der Anpassungstabelle 53 verbleiben nunmehr Textteilinformationen entlang 
1 0 eines Pfades P 1 und eines Pfades P2 der korrigierten Textinfonnation CTI, die fiir eine 
Anpassung der Sprachkoeffizienten-Information SKI verwendet werden konnten. 

Der Pfad PI enthalt eine erste Textteilinformation ,J3ear John I herewith", der von den 
Textvergleichsmitteln 52 keine Strafpunkte zugeordnet werden und deren 
Ubereinstimmungswert daher den Mindestwert MW uberschreitet. Der Pfad PI enthalt - 
1 5 nach der ersten Textteilinformation eine zweite Textteilinformation „order three computer 
Quality and" der funf Strafjjunkte (1) bis (5) fur die Einfugung der Worte „order three 
computer Quality" und die Ersetzung des Wortes ..organ" durch das Wort „and" 
zugeordnet werden und deren Ubereinstimmungswert daher den Mindestwert MW 
unterschreitet. Der Pfad PI enthalt nach der zweiten Textteilinformation eine dritte 
20 Textteilinformation „three computer Standard for my office Harry", der nur ein Strafpunkt 
(6) fur die Einfugung des Wortes ..Standard" zugeordnet wird und deren 
Ubereinstimmungswert CI daher den Mindestwert MW uberschreitet. Der Pfad PI enthalt 
daher die erste und die dritte Textteilinformation, die prinzipiell fiir eine Anpassung der 
Sprachkoeffizienten-Information SKI geeignet sind. 
25 Der Pfad P2 enthalt eine vierte Textteilinformation , JDear John I herewith order three 
computer Quality", der von den Textvergleichsmitteln 52 nur ein Strafpunkt (1) fur die 
Ersetzung des Wortes „organ" durch das Wort „order" zugeordnet wird und deren 
Ubereinstimmungswert CI daher den Mindestwert MW uberschreitet. Der Pfad P2 enthalt 
nach der vierten Textteilinformation eine funfle Textteilinformation ..and three computer 

Standard" der vier Strafpunkte (2) bis (5) fiir die E infu gung diesar Worts 7iigf^f>rrinH '"ird 

und deren Ubereinstimmungswert daher den Mindestwert MW unterschreitet. Der Pfad P2 
enthalt nach der fUnften Textteilinformation eine sechste Textteilinformation ..for my 
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office Harry*', der ein Strafpunkt (6) fiir die Ersetzung des Wortes , Jvlary" durch das Wort 
„Harry" zugeordnet wird und deren Ubereinstimmungswert CI den Mindestwert MW 
uberschreitet. Der Pfad P2 enthalt daher die vierte und die sechste Textteilinformation, die 
prinzipiell fur eine Anpassung der Sprachkoeffizienten-Information SKI geeignet sind. 
5 . Die Textvergleichsmittel 52 sind nunmehr zum Ermitteln der Textteilinformationen des 
Pfades PI Oder P2 ausgebildet, die den groBten Summen-Ubereinstimmungswert SCI 
aufweisen. HierfUr ermitteln die Textvergleichsmittel 52, daB neun Worte des Pfades PI 
und zehn Worte des Pfades P2 der korrigierten Textinformation CTI vollkommen mit 
Worten der erkannten Textinformation RTI ubereinstimmen und in der Anpassungstabelle 

10 53 als graues Feld gekennzeichnet sind. Weiters werden von den Textvergleichsmitteln 52 
die Strafpunkte jedes Pfades addieren, wobei fur den Pfad PI sieben Strafpunkte und fur 
den Pfad P2 sechs Strafpunkte ermittelt werden. 

SchlieBlich ermitteln die Textvergleichsmittel 52, daB die Textinformationen des Pfades 
P2 mit zehn ubereinstimmenden Worten und nur sechs Strafpunkten eine groBere 

1 5 Summen-Ubereinstimmung mit der erkannten Textinformation RTI aufweisen und geben 
einen entsprechend hohen Summen-Ubereinstimmungswert SCI fiir die 
Textteilinformationen des Pfades P2 an die Anpassungsmittel 50 ab, 

Hierdurch ist der Vorteil erhalten, daB fiir die Anpassung der Sprachkoeffizienten- 
Information SKI gemaB der ersten Art der Korrektiu* korrigierte Worte - wie beispielsweise 

20 „order" und ,3arry" - zur Anpassung verwendet werden und gemaB der zweiten Art der 
Korrektur korrigierte Textteilinformationen - wie beispielsweise „and three computer 
Standard", die mit der Sprachinformation keinen Zusammenhang aufweisen - nicht zur 
Anpassung verwendet werden. Hierdurch wird die Sprachkoeffizienten-Information SKI 
besonders rasch und gut an Eigenarten der Aussprache eines Benutzers und typische 

25 Formulierungen eines Benutzers angepaBt, womit eine besonders gute Erkennungsrate der 
Spracherkennungseinrichtung erzielt wird. 

Die Anpassungsmittel 50 sind bei in der Spracherkennungseinrichtung aktivierter 
Anpassungs-Betriebsart nach dem Erhalt des Summen-Ubereinstimmungswerts SCI von 
den Textvergleichsmitteln 52 zum Auslesen der Textteilinformationen des Pfades P2 der 

30 korrigierten Textinformation CTI aus den Korrigierter-Text-Speichermitteln 46 und zum 
Auswerten dieser Textteilinformationen ausgebildet. 

Hierbei werden zur Anpassung der Wortschatz- Information WI jedem Wort der vierten 
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und der sechsten Textteilinfomiation ,JDear", ,Johii", ,,1", „Harry" der Wortfolge P2 in 
den Wortschatz-Speichermitteln 39 zugeordnet gespeicherten Haufigkeitszahler der Wert 
„r' hinzu addiert, wobei der Haufigkeitszahler die Auftrittswahrscheinlichkeit des 
jeweiligen Worts in einem Diktat des Benutzers kennzeichnet. Wenn ein Wort der zur 
5 Anpassung verwendeten Textteilinfomiation erstmals von dem Benutzer diktiert wurde, 
dann wird es in den Wortschatz-Speichermitteln 39 gemeinsam mit einem 
Haufigkeitszahler mit dem Wert „1" gespeichert. 

Zur Anpassxmg der in den Sprachmodell-Speichermitteln 40 gespeicherten 
Sprachmodell-Information SMI wird beispielsweise der der Wortfolge „I herewith order" 
10 zugeordnet gespeicherte Haufigkeitszahler um den Wert „1" erhoht, um eine hohere 
Wahrscheinlichkeit des Auftretens einer solchen Formulierung in einem Diktat des 
Benutzers zu kennzeichnen. 

Zur Anpassung der in den Phonemreferenz-Speichermitteln 41 gespeicherten 
Phonemreferenz-Information PRI werden nur solche Worte der vierten und der sechsten 
1 5 Textteilinfomiation der Wortfolge P2 gemeinsam mit der zugehorigen Audioinformation 
AI ausgewertet, die eine vollige Ubereinstimmung mit einem Wort der erkannten 
Textinformation RTI aufweisen und in der Anpassungstabelle 53 durch ein graues Feld 
gekennzeichnet sind, Zusatzlich konnen auch noch Worte der moglichen Textinformation 
PTI mit der zugehorigen Audioinformation AI ausgewertet werden, Hierfur priifen die 
20 Anpassungsmittel 50 ob ein von dem Benutzer bei der ersten Art der Korrektur ersetztes 
Wort („order", „Hany") in den Moglicher-Text-Speichermittehi 44 fur diesen Teil der 
Audioinformation AI gespeichert ist, Wenn ein solches Wort in den Moglicher-Text- 
Speichermitteln 44 gefunden wird, dann wird auch diese Wort mit der zugehorigen 
Audioinformation AI zur Anpassung der Phonemreferenz-Information PRI ausgewertet. 
25 Eine diese Anpassungen enthaltende Anpassungsinformation NI wird anschlieBend von 
den Anpassungsmitteln 50 an die Sprachkoeffizienten-Speichermittel 38 zur Anpassung 
der Sprachkoeffizienten-Information SKI abgegeben. Ebenso wird von den 
Anpassungsmitteln 50 ein Trainingsindikator TI an die Transfermittel 54 abgegeben, der 
kennzeichnet, mit wie vielen Worten die in den Sprachkoeffizienten-Speichemiitteln 38 
30 gespeicherte Sprachkoeffizienten-Information SKI bereits trainiert wurde Rif*rHiirrli \<zt H^r 
Vorteil erhalten, daB anhand des Trainingsindikators TI unmittelbar ersichtlich ist, ob die 
Spracherkennungseinrichtung bereits gut an einen Benutzer angepaBt wurde und daher 
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voraussichtlich eine gute Erkennungsrate fiir diesen Benutzer aufweisen wird. 

Gemafi einem zweiten Anwendungsbeispiel ist angenommen, daB der Benutzer der 
durch den Computer 1 gebildeten Spracherkennungseinrichtung auch einen anderen 
Computer besitzt, der eine andere Spracherkennungseinrichtung bildet. Der Benutzer 
5 mochte verstandlicherweise bei der anderen Spracherkennungseinrichtung eine gleich gute 
Erkennungsrate erzielen, wie er sie bei der durch den Computer 1 gebildeten 
Spracherkennungseinrichtung bereits erzielt, deren Sprachkoeffizienten-Information SKI er 
seit mehreren Monaten trainiert hat. 

Hierfiir betatigt der Benutzer eine Taste der Tastatur 5, worauf eine Transferinformation 

10 TRI von der Tastatur 5 an die Transfermittel 54 angegeben wird. Die Transfermittel 54 
sind hierauf zum Auslesen der in den Sprachkoeffizienten-Speichermittein 38 
gespeicherten Sprachkoeffizienten-Information SKI ausgebildet. Weiters sind die 
Transfermittel 54 zum Speichem der ausgelesenen Sprachkoeffizienten-Information SKI 
und des Traniningsindikators TI der Sprachkoeffizienten-Information SKI auf einer in ein 

15 Diskettenlaufwerk des Computers 1 eingelegten Diskette 55 ausgebildet. 

Hierdurch ist der Vorteil erhalten, daB eine in den Sprachkoeffizienten-Speichermittel 
38 gespeicherte und bereits von dem Benutzer trainierte Sprachkoeffizienten-Information 
SKI von dem Computer 1 exportiert werden kann. Weiters kann die Sprachkoeffizienten- 
Information SKI in dem anderen Computer des Benutzers importierte werden. Hierdurch 

20 kann ein Benutzer eine von ihm trainierte Sprachkoeffizienten-Information SKI bei 
beliebig vielen anderen Computem, die eine der in der Figur 1 dargestellten 
Spracherkennungseinrichtung entsprechende Spracherkennungseinrichtung bilden, weiter 
verwenden und so auch bei diesen Computem eine gute Erkennungsrate der 
Spracherkennungseinrichtung erhalten. 

25 Vorteilhafterweise wird beim Exportieren der Sprachkoeffizienten-Information SKI 
ebenso der Trainingsindikator TI der Sprachkoeffizienten- Information SKI mit exportiert, 
womit bei einem Importieren der Sprachkoeffizienten-Information SKI von den 
Transfermitteln 54 vorerst prufbar ist, ob die zu importierende Sprachkoeffizienten- 
Information SKI bereits besser trainiert ist als die in den Sprachkoeffizienten- 

30 Speichermitteln 38 g es peicherte Sprachkoeffizienten-Information SKI. Die Transfermittel 
54 importieren die Sprachkoeffizienten-Information SKI nur dann, wenn die Priifung 
ergibt, daB die zu importierende Sprachkoeffizienten-Information SKI bereits besser 
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trainiert ist als die in den Sprachkoeffizienten-Speichennitteln 38 gespeicherte 
Sprachkoeffizienten-Information SKI. 

GemaC einem dritten Anwendungsbeispiel ist angenommen, daB der Computer 1 einen 
mit dem Internet verbundenen Internet-Server bildet und mit einem vierten AnschluB 56 
5 mit dem Intemet verbunden ist. Weiters sei angenommen, daC der Benutzer eines weiteren 
Computers, der eine Diktiereinrichtung bildet, die in Hompage-Speichermitteln 57 des 
Computers 1 gespeicherte Textinformation einer Homepage des Internet-Senders abgefragt 
hat und diese Textinfonnation uber den vierten AnschluB 56 an den weiteren Computer 
abgegeben wurde. Diese Textinformation der Hompage enthah Link-Informationen, mit 
1 0 denen weitere in den Hompage-Speichermitteln 57 gespeicherte Textinformationen 
abgefragt werden konnen, wie dies allgemein Ublich ist. Die in der Figur 1 dargestellte 
Spracherkennungseinrichtung des Internet-Servers ermoglicht dem Benutzer des weiteren 
Computers ein Aktivieren einer in der Homepage dargestellten Link-Information durch 
eine mit dem weiteren Computer eingegebene Sprachinformation. 
1 5 GemaB dem dritten Anwendungsbeispiel ist weiters angenommen, daB der Benutzer die 
in der Hompage angegebene Link-Information .^lotels" aktivieren mochte. Hierfur betatigt 
der Benutzer eine Record-Eingabetaste eines Diktiermikrofons des weiteren Computers 
und spricht die Sprachinformation „HoteIs" in das Mikrofon des Diktiermikrofons. Eine 
diese Sprachinformation enthaltende Audioinfonnation AI wird dem Computer 1 uber den 
20 vierten AnschluB 56 zugefiihrt und die Audioinformation AI wird in den Audio- 
Speichermitteln 37 gespeichert. Bei der hierdurch aktivierten Spracherkennungs- 
Betriebsart der Spracherkennungseinrichtung des Computers 1 wird das Wort ,4Iotels" von 
den Spracherkennungsmitteln 42 als erkannte Textinfonnation RTI erkannt und die dieser 
Link-Information zugeordnete Textinformation wird von den Hompage-Speichermitteln 57 
25 uber den vierten AnschluB 56 an den weiteren Computer des Benutzers abgegeben. 
Bei dem Computer 1 wird nunmehr vorteilhafterweise vor der Aktivierung der 
Spracherkennungs-Betriebsart die von dem weiteren Computer exportierte und iiber das 
Intemet an den vierten AnschluB 56 abgegebene Sprachkoeffizienten-Information SKI mit 
den Transfermittein 54 importiert. Hierdurch wird der durch den Computer 1 gebildete 

30 Internet-Server an den jeweiligen Benutzer angepaBt. weshalb eine hesnnHerg hr.h^ 

Erkennungsrate erzielt wird. 

Es kann erwahnt werden, daB die Sprachkoeffizienten-Information SKI eines Benutzers 
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jeweils gemeinsam mit jeder an den Internet-Server ubertragen Audioinformation AI 
ubertragen werden kann. Besonders vorteilhaft ist es jedoch, die Sprachkoeffizienten- 
Information SKI eines Benutzers nur bei einem ersten Abfragen der Hompage des Internet- 
Servers an den Internet- Server zu ubertragen und die Sprachkoeffizienten-Information SKI 
5 in dem Internet-Server fur diesen Benutzer zu speichem. Bei jedem weiteren Empfang 
einer Audioinformation AI von dem weiteren Computer dieses Benutzers kann der 
Internet-Server die bereits gespeicherte Sprachkoeffizienten-Information SKI fur die 
Spracherkennung verwenden. 

Es kann erwahnt werden, daB die Anpassungs-Betriebsart zimi Anpassen der 

10 Sprachkoeffizienten-Information SKI auch automatisch nach dem Abspeichem einer 

korrigierten Textinformation CTI oder durch den Benutzer mit einer Taste der Tastatur 5 
des Computers 1 aktiviert werden kann. 

Es kann erwahnt werden, daC es auch andere als gemaB dem Ausfuhrungsbeispiel 
beschriebene Moglichkeiten der Ermittlung eines Ubereinstimmungswertes einer 

1 5 Textteilinformation oder eines Summen-Ubereinstinunungswertes von 

Textteihnformationen eines Pfades gibt. Weiters ist die Festlegung, daB der Mindestwert 
MW unterschritten ist, wenn drei aufeinanderfolgende Strafpunkte vergeben werden, nur 
als Beispiel zu verstehen. Ebenso konnte eine eine bestinmite Anzahl an Strafpunkten in 
einer bestimmten Anzahl an Worten einer Textteilinformation uberschreitende Anzahl an 

20 Strafpunkten als ein Unterschreiten des Mindestwertes MW festgelegt werden. 

Es kann erwahnt werden, daB es auch vorteilhaft sein kann aus einer prinzipiell zur 
Anpassung der Sprachkoeffizienten-Information SKI geeigneten Textteilinformation, deren 
Ermittlung anhand des ersten Anwendungsbeispiels erlautert wurde, nur bestinunte Telle 
zur Anpassung der Sprachkoeffizienten-Information SKI zu verwenden. Hierbei konnen 

25 beispielsweise nur Worte, denen von den Textvergleichsmitteln 52 ein Strafpunkt 

zugeordnet wurde, und diesen Worten benachbarte Worte, die in der Anpassungstabelle 53 
durch ein graues Feld gekennzeichnet sind, verwendet werden. 

Hierdurch ist der Vorteil erhalten, daB bei dem Spracherkennungsvorgang faisch 
erkannte und von dem Benutzer korrigierte (ersetzte) Worte („order", , JIarry") sowie zu 

30 diesen Worten benachbarte Worte zur Anpassung verwendet werden. Teile der korrigierten 

Textteilinformation CTI von prinzipiell zur Anpassung geeigneten Textteihnformationen, 
die voUkommen mit der erkaruiten Textinformation RTI ubereinstimmen, werden hierbei 
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nicht zur Anpassung venvendet, da diese Teile eventuell von dem Benutzer gar nicht 
korrigiert wurden. 

Es kann erwahnt werden, daB Eingabemittel einer in einer Hand haltbaren 
Eingabeeinrichtung auch zum Abgeben einer Steuerinformation an einen Computer 
5 ausgebildet sein konnen, urn den Computer aus einer Power-Save-Betriebsart in eine Akiv- 
Betriebsart aufzuwecken. 

Es kann erwahnt werden, da/3 eine mit einem FuB betStigbare Eingabeeinrichtung auch 
ganz allgemein zur Aktivierung von Betriebszustanden in dem Computer verwendbar ist. 
Hierbei konnte der Computer einen Femsehempfanger bilden und mit dem Fu/3schalter 
1 0 beispieisweise ein Femsehkanal ausgewahlt werden, in dem eine Femsehsendung 
empfangen wird, die mit dem Monitor wiedergegeben wird. 

Es kann erwahnt werden, daC an eine mit einem FuB betatigbare Eingabeeinrichtung 
auch ein Mikrofon oder ein Lautsprecher an den USB-AnschluBmitteln der 
Eingabeeinrichtung angeschlossen werden kann, wenn das Mikrofon oder der Lautsprecher 
1 5 ebenfalls USB-AnschluBmittel aufweist. In diesem Fall ist es nicht notwendig, daB die mit 
einem FuB betatigbare Eingabeeinrichtung Audio- Verarbeitungsmittel aufweist, da Audio- 
Verarbeitungsmittel zum Abgeben eines analogen Audiosignals dann in dem Mikrofon und 
dem Lautsprecher vorgesehen sind. 

Es kann erwahnt werden, daB eine digitale Datenbusverbindung auch durch eine Radio 
20 Frequency Funkverbindung, wie beispieisweise entsprechend der Bluetooth-Spezification 
(Bluetooth Special Interest Group, May 1998), gebildet sein kann. Hierdurch ergibt sich 
der Vorteil, daB keine Kabelverbindung zwischen der Eingabeeinrichtung und einem 
Computer notwendig sind. 

Es kann erwahnt werden, daB an den zweiten AnschluB 33 des FuBschalters 3 auch ein 
25 Lautsprecher angeschlossen werden kann. 
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Patentanspnlcti?; 

1 . Mit einem Fu6 betatigbare Eingabeeinrichtung (3) fur einen Computer (1), der eine 
Diktiereinrichtung bildet, mit 

FuBeingabemitteln (24) zum manuellen Eingeben einer Steuerinformation (SI), mit der 
eine Audiowiedergabe-Betriebsart der Diktiereinrichtung aktivierbar (25) und deaktivierbar 
(26) ist, wobei bei aktivierter Audiowiedergabe-Betriebsart eine in der Diktiereinrichtung 
gespeicherte Audioinfomiation (AI) an einen Kopfhdrer (34) bzw. einen Lautsprecher (32) 
abgebbar ist, und mit 

AnschluBmitteln (28, 33, 35) zum AnschHefien der Eingabeeinrichtung (3) an den 
Computer (1), wobei von den AnschluBmitteln (28, 33, 35) die Steuerinformation (SI) an 
den Computer (1) abgebbar ist, 
dadurch gekennzeichnet, 

da6 an die AnschluBmittel (28, 33, 35) eine digitale Datenbusverbindung anschliefibar ist 
und dafi die AnschluCmittel zum Empfangen der Audioinformation (AI) als digitale 
Audiodaten von dem Computer (1) und zum Abgeben der Steuerinformation (SI) als 
Steuerdaten an den Computer (1) uber die digitale Datenbusverbindung ausgebildet sind 
und 

daB an die AnschluBmittel (28, 33, 35) der Kopfhorer (34) bzw. der Lautsprecher 
anschlieBbar ist. 

2. Eingabeeinrichtung (3) nach Anspruch 1, dadurch gekennzeichnet, daB Audio- 
Verarbeitungsmittel (29) vorgesehen sind, die zum Verarbeiten der mit den 
AnschluBmitteln (28, 33, 35) empfangenen Audioinformation (AI) und zum Abgeben eines 
analogen Audiosignals (AS3) fiir den Kopfhorer (34) bzw. den Lautsprecher an die 
AnschluBmittel (33) ausgebildet sind. 

3. Eingabeeinrichtung (3) nach Anspruch 2, dadurch gekennzeichnet, daC die 
AnschluBmittel (28) zum Aufbau einer USB-Datenbusverbindung (Universal Serial Bus: 
Specification Version 1.0 on January 15 or Version 2.0) ausgebildet sind. 

4. Eingabeeinrichtung (3) nach Anspruch 1, dadurch gekennzeichnet, daB ein 
Lautsprecher (32) vorgesehen ist und daB die Audio- Verarbeitungsmittel (29) zum 

30 Abgeben des analogen Audiosignals an den eingebauten Lautsprecher (32) ausgebildet 

sind. 
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5. Eingabeeinrichtung (3) nach Anspruch 1, dadurch gekennzeichnet, daB 



PHO 99.531 EP-P -23 - 

AnschluBmittel zum Aufbau einer digitalen Datenbusverbindung uber eine Radio 
Frequency Funkverbindung ausgebildet sind. 

6. Eingabeeinrichtung nach Anspruch 5, dadurch gekennzeichnet, daB die 
AnschluBmittel zum Aufbau einer der Bluetooth-Spezification (Bluetoodi Special Interest 
5 Group, May 1998) entsprechenden Radio Frequency Funkverbindung ausgebildet sind. 
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FuBschaltfir ffir einpii Pompiiffir 

Bei einer mit einem FuJ3 betatigbare Eingabeeinrichtung (3) ftir einen Computer (1), der 
eine Diktiereinrichtung bildet, mit FuBeingabemitteIn (24) zum manuellen Eingeben einer 
Steuerinformation (SI), mit der eine Audiowiedergabe-Betriebsart der Diktiereinrichtung 
aktivierbar (25) und deaktivierbar (26) ist, wobei bei aktivierter Audiowiedergabe- 
Betriebsart eine in der Diktiereinrichtung gespeicherte Audioinfotmation (AI) als analoges 
Audiosignal (AS3) an einen Kopfhorer (34) bzw. einen Lautsprecher (32) abgebbar ist, und 
mit AnschluBmitteln (28, 33, 35) zum Anschliefien der Eingabeeinrichtung (3) an den 
Computer (1), wobei von den AnschluBmitteln (28, 33, 35) die Steuerinformation (SI) an 
den Computer (1) abgebbar ist, sind nunmehr die AnschluBmittel (28, 33, 35) zum 
Empfangen der Audioinformation (AI) als digitale Audiodaten von dem Computer (I) und 
zum Abgeben der Steuerinformation (SI) an den Computer (1) iiber eine digitale 
Datenbusverbindung ausgebildet und ist an die AnschluBmittel (28, 33, 35) der Kopfhorer 
(34) bzw. der Lautsprecher anschliefibar. 
(Figur 3) 
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